# 使用多个GPU训练
CUDA_VISIBLE_DEVICES=0 torchrun --standalone --nproc_per_node=1 \
  main_finetune.py \
  --batch_size 128 \
  --blr 6e-4 \
  --time_steps 4 \
  --warmup_epochs 10 \
  --epochs 200 \
  --model metaspikformer_8_512 \
  --data_path /raid/ligq/imagenet1-k \
  --output_dir outputs/55M \
  --log_dir outputs/55M \
  --model_mode ms \
  --dist_eval
